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摘要 ;复杂 动力 系统 研究 中 的 一 个 重要 内 容 是 发 现 以 多 元 时 间 序 列 形式 存在 的 各 组 成 部 分 间 
的 相互 作用 关系 。 因果 关 系 相 比 于 相关 关系 对 系统 的 本 质 机 制 进行 了 更 深入 的 探索 , 并 以 超 
越 简 单 相 关 性 分 析 的 方式 在 对 复杂 动力 系统 的 研究 中 发 挥 巨 大 作用 . 格 兰 杰 因果 关系 分 析 提 
供 了 一 种 强大 的 时 间 序 列 结构 发 现 框 架 , 自 提出 后 被 各 领域 广泛 应 用 , 具有 重要 的 研究 意义 
和 现实 价值 。 但 在 诸如 入 体 生理 系统 这 样 高 度 复杂 的 非 线 性 动力 系统 中 , 其 因果 关系 建立 在 
多 元 、 非 线性 、 动 态 的 时 间 序 列 上 , 这 对 于 传统 格 兰 杰 因果 关系 分 析 方 法 是 很 大 挑战 。 为 此 ， 
本 文 提 出 一 种 基于 深度 学 习 的 动态 格 兰 杰 因果 关系 分 析 方法 DNNGC， 来 发 现 复 杂 、 动 态 、 非 
线性 的 多 元 时 间 序 列 间 的 格 兰 杰 因果 关系 。 DNNGC 利用 深度 学 习 对 复杂 非 线 性 关系 的 建 模 能 
力 来 充分 拟 合 多 元 时 序数 据 间 的 非 线 性 关系 ,通过 在 原 格 兰 杰 因果 关系 的 基础 上 添加 存在 时 
间 段 实现 了 动态 因果 分 析 , 并 改进 其 预测 结构 使 模型 空间 复杂 度 从 0 (n2) 降 为 0(n)， 以 便 对 
现实 系统 中 大 规模 时 间 序 列 上 的 分 析 具 有 更 好 的 可 行 性 。 此 外 , 本 文 还 设计 了 适应 格 兰 杰 因 
果 关 系 的 神经 网 络 架 构 , 并 在 三 种 典型 的 格 兰 杰 因果 关系 存在 形式 下 , 对 DNNGC 的 实验 结果 
进行 了 详细 讨论 。 最 后 本 文 将 DNNGC 应 用 在 人 体 睡眠 期 间 各 生理 系统 间 的 分 析 中 , 发 现 了 人 
体 潜在 的 、 动 态 的 格 兰 杰 因 果 关 系 状 况 ， 具 有 很 好 的 现实 意义 。 
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Abstract: A significant issue in the study of complex dynamical systems is to 
discover the interaction between the components stored in the form of multivariate 
time series. Compared with the correlation, causality further explores the essential 
mechanism of the system, and plays a great role in the study of complex dynamic 


systems in a way beyond simple correlation analysis. Granger causality analysis 
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provides a powerful time series structure discovery framework, which has been widely 
used in various fields since proposed, with important research significance and 
practical value. However, in highly complex nonlinear dynamical systems such as the 
human physiological system, where causality is based on the time series of 
multivariation, nonlinearity and dynamics, it’ sahuge challenge to the traditional 
granger causality analysis method. In order to solve this problem, a deep 
learning-based dynamic granger causality analysis method DNNGC is proposed, to 
discover the granger causality among complex, dynamic and nonlinear multivariate 
time series. DNNGC utilizes the modeling ability of deep learning to fully fit the 
nonlinear relationships between multivariate time series data. By adding existence 
time periods to the original granger causality, DNNGC realizes dynamic causal 
analysis. It' s improving granger causality' s prediction structure that enables 
DNNGC to reduce the model space complexity from 0(n2) to O(n), making it more feasible 
for the analysis of large-scale time series in real-world systems. In addition, a 
deep neural network architecture adapted to granger causality is designed. The 
experimental results of DNNGC are discussed in detail under three typical forms of 
granger causality. Finally, applying DNNGC to the analysis of human 
inter-physiological systems during sleep to discover potential and dynamic granger 
causality in the human body has good practical significance. 
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1 引言 


复杂 动力 系统 中 各 组 分 的 活动 通常 以 多 元 时 间 序 列 的 形式 记录 和 存储 , 这 些 
序列 实际 上 反映 了 系统 的 运行 过 程 口 ， 研 究 其 中 动态 变化 的 相互 作用 关系 可 以 发 
现 和 理解 系统 的 运行 机 制 和 潜在 结构 。 例 如 脑 电 图 (electroencephalogram,， EEG) 
记录 并 反映 了 大 脑 神经 元 的 活动 , 已 有 研究 从 脑 电 图 中 发 现 信息 流动 与 大 脑 内 在 
网 络 结构 有 关外, 通过 从 多 元 时 间 序 列 中 使 用 各 种 相互 作用 关系 分 析 方 法 研究 大 
脑 功能 网 络 结构 能 更 好 地 理解 大 脑 如 何 执行 特定 的 功能 1。 

当 仅 使 用 简单 的 相关 或 不 相关 性 来 表述 多 元 时 间 序 列 间 的 相互 作用 时 , 由 于 
相关 性 对 方向 识别 的 内 在 缺陷 以 及 共同 驱动 变量 的 影响 中 ,间接 相互 作用 的 变量 
可 能 会 被 判断 为 直接 相关 ， 容 易 造 成 复杂 系统 内 相关 信息 的 元 余 或 虚假 。 而 因果 
关系 59 则 对 相互 作用 关系 进一步 解释 了 “ 谁 导 致 了 谁 ” 表述 了 变量 间 的 信息 流 
H, 更 能 发 现 系统 本 质 机 制 , 并 以 超越 简单 相关 性 分 析 的 方式 在 对 复杂 动力 系统 
的 研究 中 发 挥 巨大 作用 器。 例如 人 体 各 生理 系统 持续 交互 产生 了 大 量 多 元 时 间 序 
列 ， 1(a) 表 示 由 人 体 4 个 部 位 产生 的 电信 和 号 组 成 的 多 元 时 间 序 列 ，(b) 和 (c) 分 
别 表 示 给 定时 间 段 内 人 体 睡 眠 期 间 多 元 时 间 序 列 上 的 相关 性 分 析 和 动态 因果 关 
系 分 析 结 果 。 其 中 蓝 线 表示 系统 本 质 : 眼 动 (electrooculogram，EOG) 导 致 了 心率 
(electrocardiogram, ECG) 和 下 巴 肌 肉 张力 (chin electromyography, CHIN EMG), Ù 
率 (ECG) 导 致 了 大 脑 活动 (EEG)， 但 相关 性 分 析 则 发 现 所 有 变量 都 是 相关 的 ， 虚 
假 的 作用 关系 如 (c) 中 灰 线 所 表示 ， 这 就 导致 信息 的 错误 。 

对 于 人 体 这 种 高 度 复 杂 的 多 元 非 线 性 系统 而 言 , 各 部 位 的 因果 关系 又 是 随时 
间 动 态 变 化 的 , 比如 生理 学 家 已 发 现在 深 睡 期 间 主 要 是 脑 部 系统 的 交互 而 浅 睡 期 
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间 则 全 喘 系 统 的 交互 增多 趾 。 如 图 1 所 示 ， 动 态 变化 体现 在 某 些 部 位 的 因果 关系 
过 一 段 时 间 就 消失 或 出 现 ， 可 能 出 现 图 1(c) 中 随时 间 变 化 的 因果 关系 。 如 果 能 从 
这 些 多 元 时 间 序 列 中 分 析出 系统 随时 间 动 态 变化 的 格 兰 杰 因果 关系 , 更 有 助 于 理 
解 系统 的 本 质 机 制 。 由 于 任何 一 个 变量 对 应 的 系统 出 现 故障 都 可 能 导致 整个 人 体 
的 发 病 , 如 果 能 够 通过 分 析 而 知晓 人 体 各 部 位 的 动态 因果 关系 , 则 当 某 个 变量 在 
某 个 时 间 点 出 现 问题 时 , 就 能 迅速 将 潜在 原因 限制 在 该 时 间 段 对 故障 变量 有 因果 
关系 的 变量 中 ， 以 便 尽 快 找到 事故 原因 ， 节 省 医疗 救治 中 宝贵 的 时 间 。 


(a) 人 体 四 个 部 位 产生 的 电信 号 


— Eye movements(EOG) —— Chin muscle tone(CHIN EMG)  — d —— Brain activity(EEG) 


T 


Potenial difference/uv 


图 1 nm 眼 期 间 多 元 时 间 序 列 间 的 动态 因果 关系 和 相关 性 分 析 示 例 

格 兰 杰 因果 关系 (granger causality，GC) 外 提供 了 一 种 强大 的 时 间 序 列 结构 发 
现 框架 , 它 量 化 了 一 个 时 间 序 列 的 过 去 有 助 于 预测 另 一 个 时 间 序 列 的 未 来 演变 的 
程度 ， 从 预测 的 角度 定义 了 “因果 关系 ” 格 兰 杰 因 果 关 系 自 提 出 后 被 广泛 应 用 
于 经 济 包 、 金 融 09 等 领域 ， 目 前 正 逐 渐 流 行 于 神经 科学 的 研究 中 0， 典 型 的 应 用 
是 将 格 兰 杰 因果 关系 作为 从 多 元 时 间 序 列 中 分 Y Wr io P A IOS FX (effective 
connectivity) ?! fj — P 3E EZ; YE, PE — ^ TRES Z& £t Ur far a — ^ TRES ZR ER 
[13-14] 

但 是 将 传统 格 兰 杰 因果 关系 应 用 在 复杂 系统 多 元 时 间 序 列 上 的 因果 分 析 时 
也 存在 以 下 挑战 : (1) 传 统 格 兰 杰 因果 关系 只 分 析 两 个 变量 而 忽略 系统 中 其 它 序 
列 的 影响 ，(2) 需 要 较 强 的 先 验 知识 来 假设 变量 间 的 关系 是 线性 的 ， 难 以 分 析 多 
元 时 间 序 列 间 复 杂 的 非 线 性 关系 ; (3) 静态 地 分 析 整 个 时 序 上 的 因果 ， 无 法 捕捉 
复杂 系统 中 潜在 、 动 态 的 因果 关系 。 

深度 神经 网 络 能 够 表示 输入 和 输出 之 间 复 杂 的 非 线 性 相互 作用 , 长 短期 记忆 
I2 (long short-term memory, LSTMD)0 7 在 预测 多 元 时 间 序 列 方面 表现 出 令 人 印 
象 深刻 的 性 能 08， 而 预测 又 对 于 确定 变量 间 格 兰 杰 因果 关系 至 关 重 要 ; 同时 深 
度 神经 网 络 作 为 一 种 数据 驱动 的 非 参数 方法 , 可 以 在 不 需要 任何 先 验 知识 的 情况 
下 训练 得 到 具有 良好 效果 的 模型 , 非常 适合 建 模 复杂 未 知 系统 中 多 元 时 间 序 列 间 
的 复杂 非 线性 关系 0220。 


2 相关 工作 


格 兰 杰 因果 关系 可 以 追溯 到 Wiener 提出 的 因果 关系 的 统计 学 概念 PN， 如 果 
知道 时 间 序 列 了 的 过 去 可 以 改善 对 和 的 预测 《与 单独 使 用 的 过 去 相 比 )， 了 会 


导致 X。 诺 贝尔 经 济 学 奖 获得 者 Granger?ltE Bü gU RE I 2X E p] 5e E [od LER 7C 
(vector autoregressive model, YAR) 的 背景 下 正式 提出 用 于 时 间 序 列 的 因果 关系 概 
A: 和 如果 使 用 所 有 可 用 信息 (代表 t-l 时 刻 ( 含 ) 以 前 所 有 相关 变量 的 历史 信 
恩 )， 能 够 比 使 用 除 了 之 外 的 信息 (UM -了 ), 更 好 地 预测 ,， 并 经 过 统计 检验 证 明 
结果 显著 性 ， 则 丈 导 致 了 成 ， 即 现在 通常 被 称 为 的 格 兰 杰 因果 关系 。 简 单 地 来 
说 如 果 仅 使 用 X. 的 历史 信息 预测 X 的 预测 效果 在 引入 7 的 历史 信息 后 得 到 提 
升 ， 意 味 着 有 信息 从 于 流向 生 ， 则 称 于 对 站 ,有 格 兰 杰 因果 关系 。 
传统 格 兰 杰 因果 关系 突出 的 问题 ，(1) 需 要 很 强 的 先 验 知识 去 预定 义 模型 是 
VAR; (2) 建 模 函 数 为 线性 函数 ， 难 以 分 析 非 线性 关系 ; (3) 仅 考虑 二 元 间 的 因果 
关系 ， 没有 竹 谨 任何 洛 在 的 混杂 因素 ， 难以 正确 分 析 复 杂 系 统 中 多 元 间 的 因果 关 
系 ; (4) 静态 地 分 析 整 个 时 序数 据 上 的 因果 。 
研究 人 员 针 对 以 上 传统 格 兰 杰 因果 关系 的 缺点 提出 了 大 量 改进 模型 六 。 条 
ft GC 分 析 则 是 在 (1)(C) 的 基础 上 引入 条 件 变 量 卢 ， 有 效 地 区 分 变量 间 的 直接 因 
果 和 间接 因果 。 并 提出 带 有 惩罚 项 的 模型 ， 比 如 lassop49、group-lassoP5] 等 ， 以 
解决 稀 玖 回归 问题 ,将 格 兰 杰 因果 关系 推广 至 高 维系 统 。 非 线性 GC 分 析 则 是 将 
()(C) 中 的 线性 函数 改进 为 非 线性 函数 ， 关 键 在 于 核 函数 的 选择 ， 比 如 基于 径 向 
基 函 数 (radial basis functions, RBF)P4、 基 于 再 生 核 Hilbert 空间 (reproducing kernel 
hilbert spaces, RKHS) "4, 用 于 解决 非 线 性 系统 的 因果 问题 。 但 这 些 改进 的 方法 
仍然 存在 不 足 : CIO 需要 一 定 的 先 验 知识 来 预先 定义 模型 的 类 型 ， 而 通常 对 于 一 
个 未 知 系统 ， 其 本 质 的 过 程 又 是 难以 提前 知晓 的 ; (2) 难以 设计 足够 复杂 的 函数 
模型 ， 去 拟 合 高 度 复杂 动力 系统 的 非 线性 机 制 |。 
而 采用 神经 网 络 的 格 兰 杰 因果 关系 分 析 方 法 目前 只 有 初步 的 探索 ,Attanasio 
Montalto 等 2 将 前 馈 神 经 网 络 应 到 GC 分 析 中 ， 但 其 网 络 结构 仍然 相对 
简单 。 最 近 的 研究 中 Alex Tank 等 60 通 过 神经 网 络 中 隐藏 层 的 参数 来 确定 变量 间 
的 格 兰 杰 因果 关系 ， 这 种 方法 需要 对 神经 网 络 参数 施 以 较 大 的 惩罚 使 得 潜在 无 用 
的 参数 尽 可 能 为 0， 却 导致 网 络 训练 时 间 过 长 ， 复 杂 度 较 高 ， 现 实意 义 欠 佳 。 而 
且 目 前 的 研究 还 未 将 神经 网 络 与 动态 研究 格 兰 杰 因果 关系 相 结 合 。 


3 ”问题 定义 


假设 复杂 动力 系统 中 包含 n PEREX, Xo o X) EBE 7 个 观测 点 
(1,2,…,D) 的 时 间 段 内 观测 到 该 系统 的 动态 变化 过 程 ， 其 第 i 个 观测 点 和 第 iL 个 
观测 点 间 的 真实 时 间 间 隔 可 互 不 相同 ， 与 实际 系统 和 时 序数 据 有 关 。 因 此 每 个 变 
量 在 工 个 观测 点 内 都 对 应 形成 了 一 个 时 间 序列 , 令 Xi 表示 第 i 个 变量 (时 间 序列 ) 
第 t 个 观测 点 的 值 ， 且 下 文 第 i 个 变量 可 理解 为 第 i 个 时 间 序列 。 

定义 1。 系 统 所 处 状态 和 系统 所 累积 的 信息 。 对 于 某 一 个 时 刻 1， 表 示 第 1 
个 观测 点 ， 系 统 所 处 的 状态 为 U, = (0, X5, X) eR"。 系 统 所 包含 的 所 有 
信息 UU, Up) 构成 复杂 动力 系统 的 多 元 时 序数 据 ， 定 义 
U -(U, UU, ERER + 时 刻 之 前 系统 所 累积 的 信息 ,，k 为 模型 阶 
数 。 


IO 


定义 2。 最 佳 预测 值 。 定 义 P(X;, | Ut) 为 使 用 系统 上 时 刻 之 前 系统 所 累积 的 
c s Lt, 进行 预测 而 得 到 的 吧 * 的 最 佳 预测 值 。Z4 八 X 表示 时刻 之 前 系统 所 累积 
的 信息 中 去 除 第 ;个 变量 X 的 信息 ，ie (1,2,…,n), PX; | UN X) 7318 HI EXRE 
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BR XX 后 信息 进行 预测 而 得 到 大, 最 佳 预测 值 。 

定义 3。 动 态 格 兰 杰 因果 关系 。 在 格 兰 杰 因果 关系 概念 的 基础 上 引入 存在 时 
间 段 ， 表 示 格 兰 杰 因果 关系 在 某 个 特定 的 时 间 段 内 存在 。 定 义 存在 时 间 段 
ETP = (15,4 slot) (1,2,…,T)， 其 中 工 表示 存在 时 间 段 的 长 度 ， 相 令 
两 个 时 间 点 f.、tij(ti,tiy e ETP) 可 不 连续 ， 即 1 | 一 t, #1 成 立 ， 故 存在 时 间 段 
内 的 时 间 点 可 任意 取 自 了 个 观测 点 , 由 时 间 序 列 中 动态 的 时 间 点 进而 实现 动态 的 
因果 分 析 。 定 义 动 态 格 兰 杰 因果 关系 的 形式 为 ( 格 兰 杰 因果 关系 , 存在 时 间 段 )， 
例如 (Xi > X, ETP). 基于 格 兰 杰 因果 关系 核心 思想 可 预测 性 ， 在 存在 时 间 段 
ETP 内 ， 判 断 各 对 和 ¥ 有 具有 格 兰 杰 因果 关系 的 方式 是 满足 公式 (1): 

var(X js - P(X j, |U4)) < var(X js -P(X ja | UG \ XD (1) 

其 中 总 为 目标 变量 ， 浆 为 源 变量 。 动 态 格 兰 杰 因果 关系 通过 关联 格 兰 杰 因果 关 
系 与 其 存在 时 间 段 来 实现 动态 因果 分 析 。 

本 文 所 研究 的 问题 是 ， 从 所 有 观测 点 中 指定 存在 时 间 段 五 7P， 分 析 复 杂 动 
力 系 统 在 此 时 间 段 中 多 元 间 的 格 兰 杰 因果 关系 状况 。 县 体 目标 为 分 析 系 统 中 变量 
Xn X; G, j€n) 4E ETP 中 ， 以 其 它 变量 为 条 件 变量 {X |mzi, 让 的 情况 下 ， 是 
否 存在 格 兰 杰 因果 关系 9 X BR X; 下 XX; 或 二 者 都 存在 。 
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图 2 基于 深度 学 习 的 动态 格 兰 杰 因果 关系 分 析 方 法 整体 架构 
本 文 提出 的 基于 深度 学 习 的 动态 格 兰 杰 因果 关系 分 析 方 法 模型 框架 如 图 2 
所 示 ， 其 显示 了 基于 深度 神经 网 络 的 格 兰 杰 因果 分 析 的 一 般 过 程 。 
4 适用 于 格 兰 杰 因 果 分 析 的 深度 网 络 架构 
假设 复杂 系统 共有 n AERE xus ESTERI (0,2... MWR, X; 
KEFY, XAFI, {Xmm 为 条 件 变 量 ， 则 通常 判断 敌对 X; f mH T 
兰 杰 因果 关系 而 建立 的 模型 为 : 
full: X j, = DNN (X or Xo ed dd ta (2) 


reduced : Xj, = DNN (X, a. X» 4... Xa) er (3) 
其 中 (3) 去 除了 X 的 信息 ，DNN 代表 深度 神经 网 络 ， 如 MLP, RNN, 
Xi a m OE Xi Xi ) 表 示 时 间 序 列 守 的 历史 信息 。 通 过 比较 full 和 
reduced 模型 残 差 的 方差 进而 判断 X; 是 否 对 有 格 兰 杰 因果 关系 。 
以 上 的 通常 方法 判断 X;: 是 否 对 如 有 格 兰 杰 因果 关系 需要 建 并 两 个 模型 : full 
和 reduced， 而 判断 对 Xi; 又 需要 建立 另外 两 个 模型 ， 在 解决 多 元 问题 时 需要 建 
立 2 个 模型 ,对 现实 多 元 系统 来 说 复杂 度 较 高 。 因 此 本 文 对 格 兰 杰 因果 关系 的 
采用 联合 建 模 的 方式 来 对 一 个 变量 所 有 可 能 格 兰 杰 导致 的 变量 进 
J 分 析 ， 将 模型 数量 降 至 n+1， 提 出 改进 的 用 于 格 兰 杰 因果 分 析 的 深度 神经 网 络 
En 如 图 2 所 示 。 
1 时刻 系 统 状 态 为 Uy - (Xu: TO m 小 ， , 则 时刻 之 前 系统 累积 的 信息 为 
U, 如 式 (4) 所 示 。 此 时 不 再 如 公 \ 式 (2)(3) 单 独 输入 变量 XX 的 过 去 x ,而 是 将 1 时 刻 
系统 所 处 状态 UU, 作 为 一 项 滞后 ， 整 个 模型 的 输入 即 为 UY =U, y RKT E 
个 系统 的 过 去 。 而 令 U,\X; 表 示 1 时 刻 系统 去 除 Xi 的 信息 后 所 包含 的 信息 ,， 用 于 
判断 源 变 量 X; 是 否 对 其 它 变 量 有 格 兰 杰 因果 关系 。 同 时 输出 也 不 再 是 仅仅 对 f 
时 刻 的 马 , 进 行 预测 ， 而 是 对 上 时 刻 整 个 系统 的 状态 也, 进行 预测 。 


Xu X12 €9€ Xu 
U, = ex Sara i Xas (4) 
Xni Xni cn Xni 
具体 地 对 full 和 reduced; 分 别 建立 以 下 公式 ; 
full :U, = DNN (U, TD 5, U, 4) el (5) 
reduced; :U, = DNN(U, ,NX;,U,  NX;,..,U, \ X) te (6) 


其 中 ful 模型 表示 使 用 全 部 信息 (系统 1 时 刻 之 前 累积 的 信息 〉 进 行 状 态 预 测 ， 
reducedi 模 型 表示 使 用 系统 去 除 变 量 X; 的 信息 进行 预测 。 2 的 因果 推断 模块 
中 ， 判 断 源 变 量 XX 是 否 对 目标 变量 入 有 格 兰 杰 因果 关系 : 分 别 从 两 个 模型 预测 
结果 P we 
P(X; |U\X;)， 通 过 滑动 窗口 的 形式 得 到 系统 从 时 刻 tojyix ETZI tept 1 状态 
BUR PU, )PQU,  )...PQU, ,,)》， 从 中 取出 对 应 的 总 最 佳 预测 值 。 所 
有 的 预测 值 构 成 预测 序列 P(X; |U) 和 P(X;|U\X;)， 计 算 它们 与 真实 时 间 序 
列 久 的 误差 的 方差 : 


ETT u, j 7 var(X; O P(X j [UD (7) 
reduced, j = Y(X; O P(X | U, V XD) (8) 
其 中 加 表示 两 个 向 量 每 个 元 素 相 减 组 成 的 新 和 癌 量 , 将 深度 神经 网 络 格 兰 杰 因果 关 
系 (Deep Neural Network Granger Causality, DNNGC) 定 义 为 : 


err, 


>0, X; c. 
DNNGCX | x, — e'f ful, j — €T reduced, j "|<0 X. X i 
— Vj J 


此 时 建立 一 个 reduced 模型 可 判断 X; 对 系统 中 所 有 n 个 变量 {X ys EnA 
格 兰 杰 因果 关系 ， 通 过 改变 reduced; 模型 来 控制 从 ZW, 中 去 除 的 源 变量 。 故 
DNNGC 方法 只 需要 建立 nel 个 模型 : 1 个 共享 的 full 模型 和 nn 个 reduced; E78 , 
即 可 确定 系统 中 任意 变量 间 的 格 兰 杰 因果 关系 且 带 有 特定 的 方向 。 

根据 公式 (3)(6)， 搭 建 适 用 于 格 兰 杰 因果 分 析 的 深度 神经 网 络 架 构 ， 如 图 2 
深度 神经 网 络 模块 中 搭建 的 LSTM-FC 深度 神经 网 络 ， 选 择 循环 神经 网 络 LSTM 
作为 主体 模型 , 全 连接 (Fully Connected, FC) 用 于 调整 输出 维度 。 该 神经 网 络 染 构 
非常 适合 解决 格 兰 杰 因果 关系 问题 ， 其 一 次 数据 训练 的 输入 为 ZL ， 每 个 时 间 步 
(time step) 的 输入 为 某 一 时 刻 系统 所 处 的 状态 ， 完 美 适 应 了 格 兰 杰 因果 关系 中 的 
滞后 并 且 不 会 打 乱 每 个 时 刻 系统 所 处 的 状态 信息 。 

LSTM 的 复杂 参数 更 新 方式 允许 其 能 与 过 去 时 刻 的 信息 建立 复杂 的 非 线性 
依赖 关系 。LSTM 在 RNN 的 基础 上 ， 引 入 了 第 二 个 隐藏 状态 变量 c, ， 称 为 单元 
状态 , 其 中 包含 了 系统 过 去 时 刻 的 信息 , 并 通过 门 控 的 方式 更 新 参数 和 信息 流动 。 
有 具体 更 新 公式 如 公式 (10) 所 示 ， 其 中 已 ,万 ,o 分 别 表 示 输 入 门 、 遗 筷 门 和 输出 门 ， 
它们 控制 状态 单元 的 每 个 组 件 e; 的 更 新 方式 ， 然 后 转移 到 用 于 预测 的 隐藏 状态 
h 。 遗 扎 门 万 控制 过 去 单元 状态 影响 未 来 单元 状态 的 量 ， 而 输入 门 志 控制 当前 观 
测 影响 新 单元 状态 的 量 。 

i, = o(Wix* bit W,h, 4 + bp;) 
f= o(Wir X,+ b+ Wpf hi byf ) 
0, 2 6(W,,x, + bio + W, hi + bho) (10) 
c; = f, 8c, +h &tanh(W,, x, * b, + Wy hs, + bre) 
h, = o, & tanh(c,) 


LSTM 在 参数 更 新 的 同时 对 时 间 序 列 的 长 期 依赖 和 复杂 依赖 形式 建立 关系 。 
例如 分 析 上 时 刻 对 过 去 的 依赖 情况 ， 如 果 遗 筷 门 接近 于 1, rl 时 刻 的 信息 会 全 部 
流入 时 刻 t, 建立 对 上 1 时 刻 的 依赖 。 如 果 遗 态 门 一 直 保 持 1， 那 么 远 在 过 去 时 刻 
的 信息 会 持续 传递 直至 流入 上 上 时刻， 从 而 与 远 在 过 去 的 时 刻 建立 依赖 。 而 当 需 要 
跳 过 某 一 时 刻 时 , 调整 参数 使 得 该 时 刻 的 c,、hh, 的 计算 结果 等 于 它 上 一 时 刻 的 c,、 
h, . 在 格 兰 杰 因果 关系 的 背景 下 , 这 种 灵活 的 架构 可 以 建 模 时 间 序 列 之 间 复 杂 的 
非 线 性 依赖 关系 。 

5 格 兰 杰 因果 关系 推断 

在 实际 实验 研究 时 间 序 列 i 是否 对 时 间 序 列 j 具 有 格 兰 杰 因果 关系 时 ， 当 深 
度 神 经 网 络 足 够 复杂 以 及 训练 时 间 充 足 时 ， 去 除 某 个 源 变 量 X; 后 ， 尽 管 该 源 变 
量 对 目标 变量 名 有 格 兰 杰 因果 关系 ,但 是 最 终 并 不 会 对 reduced; 模 型 的 预测 产生 
较 大 的 影响 。 这 是 因为 深度 神经 网 络 过 拟 合 了 数据 ， 导 致 full 模型 和 reduced; T& 


型 的 预测 效果 相差 不 明显 .这 个 现象 在 相对 简单 数据 上 的 实验 中 尤其 明显 。 解 决 
过 拟 合 主要 有 两 种 方式 : 减少 参数 的 维 数 或 者 降低 每 个 维度 的 有 效 规模 6B01。 参 
数 空间 的 维 数 在 本 文 问 题 中 已 经 固定 , 故 通过 降低 每 个 参数 有 效 规模 来 解决 过 拟 
合 ， 技 术 有 正则 化 〈regularization)、 提 早 停止 〈early stopping) 等 。 正 则 化 引入 
了 额外 的 控制 神经 网 络 参 数 惩罚 程度 的 正则 化 参数 4， 然 而 对 4 取 值 难以 解释 和 
把 握 ， 因 为 本 文 神经 网 络 的 目标 是 比较 full 模型 和 reduced; 模型 的 预测 效果 哪 一 
个 更 优 ,而 4 的 取 值 直接 影响 了 最 终 的 预测 效果 ， 但 是 在 4 无 穷 个 取 值 下 难以 确 
定 最 佳 预测 值 ， 取 值 不 同 甚至 可 能 推断 出 相反 的 结果 , 这 使 得 正则 化 不 适合 在 本 
文 方法 的 背景 下 使 用 。 提 早 停止 则 是 在 验证 集 上 判断 是 否 过 拟 合 从 而 停止 训练 ， 
而 本 文 的 问题 背景 下 又 不 存在 验证 集 ， 同 样 不 适合 。 

为 了 放大 full 模型 和 reducedi 模 型 预测 效果 的 差距 ， 本 文 从 梯度 下 降 的 角度 
入 手 , 在 通过 梯度 下 降 更 新 神经 网 络 参数 的 同时 也 反映 了 一 个 事实 : 如 果 时 间 序 
列 7 对 i 有 因果 关系 ， 那 么 相 比 于 未 含有 时 间 序 列 j 信 息 的 reducedi 模 型 ， 含有 j 
EAW full 模型 应 该 更 容易 拟 合 时 间 序 列 i、 在 训练 前 期 的 预测 效果 更 优 。 因 此 
本 文 考虑 整个 神经 网 络 训 练 过 程 中 每 完成 一 次 训练 后 的 预测 误差 ， 通过 对 比 full 
模型 和 reducedi 模型 在 训练 前 期 中 的 预测 效果 来 决定 是 否 具有 格 兰 杰 因果 关系 。 

具体 地 ， 在 full 和 reduced 的 每 个 模型 训练 中 ， 每 完成 一 次 整个 数据 集 前 同 
传播 和 后 向 传播 后 (epoch), 计算 预测 结果 与 真实 结果 的 残 差 方差 errorpyi epoch 和 
ETTOT, duced, Lepoch 。 将 所 有 epoch 中 产生 的 残 差 方 差 组 合成 残 差 向 量 : 
Errorgn= CETT ia 1> rr,2 s. EF ill, Nu) € pA 和 
Erroryequced, 一 (erTeduced 1 ， ETT reduced, Noon) ， 其 中 i=1,2,...n， Nepoch 表示 模型 的 
训练 次 数 。 判 断 源 变量 X; 是 否 对 目标 变量 名 有 格 兰 杰 因果 关系 的 方法 : 当 满 足 

CD 对 所 有 的 epoch, full 模型 残 差 向 量 第 j 列 比 reduced; 模 型 残 差 向 量 第 j 列 小 

的 次 数 多 于 full 模型 残 差 向 量 第 j 列 比 reducedi 模 型 残 差 同 量 第 j 列 大 的 次 数 ， 
且 (2) 对 每 个 epoch， 前 epoch 个 训练 内 full 模型 残 差 向 量 的 均值 都 小 于 reduced; 
模型 ， 即 满足 公式 (11) 和 (12): 


NUM( Error fun, j < Error,equced,,:} 


) > NUM(Error;,;.; > Error,equced,:;) QD 


MEAN(Error y. j) < MEAN(ETTOF seduced, j) (12) 


NUM0O 表 示 满 足 某 一 条 件 的 数量 ， 其 中 :j 表示 依次 比较 误差 向 量 第 7 列 中 的 每 项 
误差 ;' MEANO 以 及 :i 表示 依次 求 第 j 列 前 epoch 个 残 差 方 差 的 均值 并 比较 , 直至 
计算 至 第 j 列 最 后 一 项 误差 都 满足 小 于 则 该 条 件 才 成 立 。 最 后 统计 检验 确定 显著 
性 ， 如 果 时 间 序 列 i 对 j7 具 有 格 兰 杰 因果 关系 ， 则 将 矩阵 Causality, OIME 1, 
否则 赋值 为 0。 重 复 对 所 有 时 间 序 列 ij 进 行 因果 分 析 后 ,得 到 输出 结果 Causality。 
DNNGC 方法 的 盆 码 如 算法 1 所 示 : 


chinaXiv:202211.00126v1 


算法 1 基于 神经 网 络 的 多 元 格 兰 杰 因果 关系 分 析 方 法 
输入 : 多 元 时 间 序 列 数 据 zi(t)，i = 1,2,… N 代表 时 间 序 列 变 量 的 编号 ， 
t= 1, 2, Ba IN 表示 时 间 序 列 长 度 ， 模型 训练 次 数 Nepoch 
输出 : 入 个 时 间 序 列 间 的 格 兰 杰 因果 关系 存在 状况 Causality € RN*N 
1: 根据 原始 多 元 时 间 序 列 数据 构建 系统 的 状态 矩阵 区 ， 根 据 模型 阶 数 k, 
构建 系统 过 去 信息 矩阵 = (U.) 5  ， 初 始 化 Causality 每 项 为 0 
2: 根据 公式 (3)(4) 建立 full 模型 和 对 每 个 时 间 序 列 i 建立 reduced; 模型 
3: for epoch in Nepoch do 
4 完成 full 模型 一 次 整个 数据 集 前 向 传播 和 后 向 传播 
5 预测 系统 状态 Ui, 计算 每 个 变量 的 预测 结果 与 真实 结果 的 残 差 方差 
error full, j,epoch. 2$ JI EIRE 2: [n] f& ETT OT pu; 


6: for i in N do 


T: 完成 reduced; 模型 一 次 整个 数据 集 前 向 传播 和 后 向 传播 
8: 预测 系统 状态 Ui, 计算 每 个 变量 的 预测 结果 与 真实 结果 的 残 差 方 


zt €TT OT reduced; ,j,epoch 并 添加 至 残 差 方差 问 量 BrrOrrequced; |j 
9: end for 
10: end for 
11: for i in N do 
12: for j in N do 


13: if NUM(Error fuu, j <ETTOTreducedij) > NUM(ErrTOT fui,j 
> Errorreduced;,i) and MEAN(Error pull,j,epoch ) < 
MEAN(Errorreducedi,j,epoch) then 

" 统计 检验 证 明显 著 性 ,时 间 序列 i 导致 j), Causality[j, i] = 1 

15: end if 

16: end for 

17: end for 


6 实验 结果 与 分 析 
本 文 在 模拟 实验 中 充分 验证 DNNGC 的 有 效 性 和 性 能 , 在 真实 的 人 体 睡 眠 数 
据 中 探索 深 睡 和 浅 睡 期 间 人 体 生 理 网 络 的 动态 格 兰 杰 因果 关系 。 
6.1 模拟 实验 
根据 格 兰 杰 因果 关系 存在 形式 的 复杂 度 , 考虑 三 种 典型 的 格 兰 杰 因果 关系 存 
在 形式 : 链 状 、 树 状 、 环 状 ， 并 探索 在 每 一 种 格 兰 杰 因果 关系 存在 形式 下 ， 格 兰 
杰 因 果 关 系 的 长 度 对 本 文 方法 的 性 能 影响 。 总 的 来 说 , 实验 结果 表明 本 文 的 方法 
可 以 准确 地 发 现 以 上 三 种 典型 格 兰 杰 因果 关系 存在 形式 的 系统 〈 多 元 时 间 序 列 ) 
中 潜在 的 格 兰 杰 因果 关系 状况 。 
本 文 使 用 的 模拟 数据 是 由 Lorenz-96565 模 型 生成 的 连续 非 线 性 数据 ，P 维 
Lorenz-96 是 一 种 强 非 线 性 模型 ， 由 如 下 的 一 系列 微分 方程 给 出 : 
dx, i 
dt 


其 中 xicomÁXeqeno Xom9pXqpemxa. F 为 决定 非 线 性 和 混沌 程度 的 强迫 参数 ， 


(13) 


- (Xia —X*,i-2 ) Xa Xx *F 
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i=1,2,...,p， 含 有 n 个 时 间 序 列 的 系统 具有 妈 2 个 格 兰 杰 因果 关系 存在 情况 。 一 个 
好 的 因果 发 现 方法 需要 尽 可 能 多 地 发 现 真 实 存在 的 因果 关系 , 并 控制 假 阳 性 的 数 
量 申 ， 因 此 选择 准确 率 (Accuracy) 作 为 评价 指标 ， 可 直观 地 体现 本 文 方法 尽 可 能 
多 地 发 现 真实 的 因果 关系 存在 情况 (true positives. true negatives) 的 同时 又 能 控制 
推断 错误 的 因果 关系 的 数量 (false positives. false negatives)， 计 算 方 式 为 
Accuracy — o (14) 
TP + FP -TN + FN 
其 中 TP 表示 真 阳性 ，TN 真 阴性 ，FP 假 阳 性 ，FN 假 阴 性 . 
(1) 链 状 格 兰 杰 因果 关系 
链 状 格 兰 杰 因果 关系 的 特点 是 对 于 一 个 时 间 序 列 , 其 只 能 导致 一 个 时 间 序 列 
或 者 被 另 一 个 时 间 序 列 导 致 。 实 验 数据 的 结构 如 图 3(a) 所 示 ， 蓝 色 线 表示 格 兰 杰 
因果 关系 ， 不 画 线 则 代表 没有 因果 关系 ， 对 full 和 reducedi 模 型 设 定 相 同 的 神经 
网 络 参数 ， 分 别 对 图 3(a) 中 长 度 1、2、4、8 的 多 元 时 间 序 列 以 及 不 同 隐藏 单元 
数量 进行 实验 ， 实 验 结果 如 图 3(b) 所 示 。 
结果 表明 长 度 为 1 和 2 的 因果 关系 发 现 的 准确 率 多 次 达到 100%， 最 低 准 确 
率 超过 75%， 长 度 为 4 和 8 的 准确 率 平均 分 别 在 85% 和 80% 左 右 。 在 隐藏 单元 
数量 取 值 的 两 端 一 般 准 确 率 取 最 小 值 , 原因 是 隐藏 单元 太 少 导致 模型 不 能 很 好 地 
模型 其 中 的 非 线性 关系 ; 太 多 则 导致 模型 过 拟 合 ,对 数据 充分 拟 合 而 不 能 区 分 full 
和 reduced 模型 之 间 的 误差 差距 ， 使 得 模型 准确 率 降 低 。 
KEL 
长 度 2 Ou Oma O) 
长 度 4 的 一 的 一 的 一 的 
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(b) 长 度 1、2、4、8 的 链 状 格 兰 杰 因果 关系 的 因果 发 现 准确 率 

图 3 链 状 格 兰 杰 因果 关系 分 析 实 验 

(2) 树 状 格 兰 杰 因 果 关 系 

树 状 格 兰 杰 因果 关系 的 特点 是 对 于 一 个 时 间 序 列 ， 其 只 能 导致 一 个 时 间 序 


列 , 但 可 以 被 其 它 任何 时 间 序 列 所 导致 。 同 样 进行 与 5.1.1 设 定 相同 的 实验 分 析 。 
实验 结果 如 图 4 所 示 ， 其 中 宽度 为 2 的 因果 关系 发 现 的 准确 率 达 到 100%, 
宽度 4 和 8 的 准确 率 最 高 分 别 达到 95% 和 92%。 但 对 隐藏 单元 数量 较为 敏感 ， 
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准确 率 波动 幅度 较 大 ， 同 样 准确 紊 最 低 在 隐藏 单元 数量 两 端 数量 取 值 的 两 端 友 
生 。 
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(a) 宽度 为 2、4、8 的 树 状 格 兰 杰 因果 关系 示例 
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(b) 宽度 2、4、8 的 树 状 格 兰 杰 因果 关系 的 因果 发 现 准 确 率 
图 4 树 状 格 兰 杰 因果 关系 分 析 实 验 

(3) 链 状 格 兰 杰 因果 关系 

环 状 格 兰 杰 因果 关系 较为 复杂 ,其 包含 着 链 状 和 树 状 关系 的 存在 形式 , 多 元 
时 间 序 列 之 间 的 格 兰 杰 因果 关系 呈现 环 状 的 形式 , 每 个 时 间 序 列 都 可 导致 任何 序 
列 或 被 任何 序列 导致 ， 如 图 6(c) 所 示 。 设 定 Lorenz-96 中 p=10，F=10， 采 样 率 
Ar=0.1， 生 成 含有 10 个 变量 、 每 个 变量 连续 1000 个 时 间 点 的 非 线性 数据 ， 生 
成 的 多 元 时 间 序 列 如 图 5 所 示 , 其 真实 的 格 兰 杰 因果 关系 存在 情况 如 图 6a) 6(c) 
所 示 。 本 文 以 该 复杂 多 元 时 序数 据 为 代表 , 展现 本 文 方法 在 复杂 的 非 线 性 多 元 时 
序数 据 上 格 兰 杰 因果 分 析 的 性 能 表现 。 
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(b) 前 100 个 时 间 点 
图 5 具有 环 状 格 兰 杰 因 果 关 系 的 多 元 时 间 序 列 样 例 


实验 设 定 深度 神经 网 络 层 数 为 >， 每 层 隐藏 单 元 数量 为 236， 学 习 率 0.01, 
模型 滞后 ( 阶 数 ) k=10，Nepocn=200。 当 深度 神经 网 络 训练 到 300 次 时 ， 此 时 网 
络 趋 于 收敛 ， 取 前 300 次 训练 参与 评判 ， 采 用 4.3 中 的 评判 标准 来 判断 变量 间 是 
否 存在 格 兰 杰 因果 关系 ,实验 直接 输出 结果 为 Causality € R99 , 如 图 6(b) 所 示 ， 
其 中 红色 框 表示 判断 错误 ， 蓝 色 块 (i, cR X; 一 Xi ， 白 色 块 表示 Xi X; 
Causality 可 视 化 为 图 6(d) 所 示 。 实 验 结 果 表 明 准 确 率 达到 了 90.0%， 并 且 如 果 仅 
将 判断 标准 调整 为 只 满足 均值 条 件 ， 即 只 需 满足 (12)， 其 准确 率 可 提升 至 94%。 


Ture positives 


False positives = -------- False negatives 


(c) 真实 格 兰 杰 因果 关系 的 可 视 化 (d) DNNGC 推断 出 的 格 兰 杰 因果 关系 的 可 视 化 
图 6 环 状 格 兰 杰 因果 关系 的 实验 结果 


6.2 睡眠 生理 分 析 

人 体 生 理 系统 具有 多 元 、 复 杂 非 线性 、 动 态 变 化 的 特点 ， 作 为 现实 世界 复杂 
动力 系统 的 典型 场景 , 将 本 文 的 方法 应 用 到 人 体 睡 眠 期 间 生理 系统 因果 关系 的 发 
MP, 分 析 本 文 的 方法 应 对 现实 复杂 动力 系统 的 表现 , 并 且 所 发 现 的 因果 有 具有 潜 
在 现实 意义 。 

生理 学 家 已 发 现 浅 睡 期 间 存 在 眼 电 和 心 电 的 稳定 交互 , 而 在 深 睡 期 间 则 不 存 
在 该 稳定 交互 四。 本 文 实验 首先 对 该 结论 进行 因果 关系 层面 的 验证 ， 然 后 分 析 该 
交互 在 整个 睡眠 期 间 的 因果 变化 , 最 后 在 深 睡 和 浅 睡 期 间 发 现 人 体 各 生理 系统 间 
的 因果 状况 。 

实验 数据 来 自 ISRUC-SLEEP DatasetB31 公 开 数 据 集 ， 从 2009-2013 年 间 科 英 
布 拉 大 学 (CHUC) 医院 睡眠 医学 中 心 获得 来 自 118 为 受 试 者 持续 约 8 小 时 的 整 
晚 多 导 睡 眠 图 (Polysomnography, PSG) 数 据 , 采样 率 200hz, 包括 6 个 脑 电 (EEG)、 
2 个 眼 电 (EOG)、1 个 心 电 (ECG)、 1 个 下 巴 肌 电 (CHIN EMG), 1 个 腿 部 肌 电 (LEG 
EMG) 共 11 个 通道 采集 的 信号 , 每 个 通道 的 大 致 放置 位 置 如 图 9 所 示 , 数据 样 例 


如 图 1(a) 所 示 。 

首先 单独 分 析 深 睡 和 浅 睡 期 间 的 眼 电 和 心 电 之 间 的 格 兰 杰 因 果 关 系 , 并 将 此 
作为 评估 本 文 方法 的 一 项 标准 。 以 公式 (9) 中 的 DNNGC 指标 为 评判 标准 ， 其 值 
大 于 0 表示 存在 从 源 变量 到 目标 变量 的 格 兰 杰 因果 关系 ， 值 越 大 表示 关系 约 强 
烈 ， 值 小 于 或 等 于 0 表明 不 存在 该 项 因果 关系 。 实 验 建立 在 118 位 受 试 者 的 全 部 
睡眠 数据 上 ， 神 经 网 络 层 数 为 2， 每 层 隐 藏 单 元 数量 为 6000，batch 大 小 设 定 为 
128。 实 验 结果 如 图 7 所 示 ， 其 中 EOGI 表示 左 眼 眼 动 信号 ，EOG2 表示 右 眼 眼 
动 信号 ，ECG 表示 心 电 信号 ， 蓝 色 线 表示 存在 从 源 生理 系统 指向 目标 生理 系统 
的 因果 关系 ， 绿 色 表 示 不 存在 该 因果 关系 ， 权 值 为 DNNGC。 结 果 表 明 深 睡 和 小 
睡 期 间 眼 电 和 心 电 间 均 存 在 一 条 EOGI > ECG 的 因果 关系 ， 但 浅 睡 的 误差 改进 
是 深 睡 的 10 倍 ， 意 味 着 该 因果 关系 的 强度 在 浅 睡 中 要 远大 于 深 睡 期 间 ， 在 浅 睡 
中 更 加 稳固 和 强烈 ， 使 得 本 文 方法 的 有 效 性 和 准确 率 再 一 次 得 到 印证 。 
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(b) 浅 睡 期 间 
图 7 深 睡 和 浅 睡 期 间 眼 电 和 心 电 的 格 兰 杰 因果 关系 
针对 一 位 受 试 者 整 晚 睡眠 的 多 元 信号 ， 以 每 30s 为 时 间 段 , 分 析 整 晚 睡眠 分 

期 中 格 兰 杰 因果 关系 EOG — ECG 的 存在 状况 ,实验 结果 如 图 8 所 示 。 其 中 蓝 线 
标记 受 试 者 的 睡眠 阶段 ， 黑 线 表示 DNNGC。 实 验 发 现 浅 睡 中 55.1% 的 时 间 段 是 
存在 EOG > ECG 的 ， 而 在 深 睡 中 只 有 28.4% 的 时 间 段 存在 。 并 且 该 结果 还 表明 
在 0.5-2.5h 以 及 4.5-7h 间 ， 受 试 者 处 于 non-REM 期 间 ，EOG > ECG 具有 连续 
保持 性 ， 通 常 伴随 着 深 睡 和 浅 睡 的 转变 在 存在 与 不 存在 间 变 化 ;而 在 0-0.5h 和 
2.5-4.5h 内 ， 受 试 者 处 于 Wake 期 间 ， 该 因果 关系 变化 剧烈 而 频繁 ， 表 明 受 试 者 
处 于 一 个 比较 混乱 的 阶段 。 
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图 8 一 位 受 试 者 整 晚 睡眠 分 期 的 动态 格 兰 杰 因果 关系 
最 后 整合 188 位 受 试 者 的 睡眠 数据 ， 以 每 个 睡眠 周期 1.3h8 为 时 间 间 隔 ， 
筛选 其 中 的 深 睡 和 小睡 阶段 ， 分 别 分 析 人 体 备 生理 系统 间 的 因果 关系 情况 。 图 9 
的 实验 结果 发 现 浅 睡 期 间 人 体 生理 系统 的 因果 关系 数量 更 多 、 交 互 更 加 复杂 。 
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(b) 深 睡 期 间 人 体 生 理 系 统 的 格 兰 杰 因果 关系 
图 9 整 晚 睡眠 中 每 1. 5h 内 的 深 睡 和 浅 睡 期 间 各 生理 系统 格 兰 杰 因 果 关 系 


7 结论 


本 文 弥补 了 现 有 格 兰 杰 因果 关系 分 析 方 法 的 缺点 , 提出 一 种 基于 深度 学 习 的 
动态 格 兰 杰 因果 关系 分 析 方 法 及 适用 的 神经 网 络 架 构 , 在 将 格 兰 杰 因果 关系 分 析 
与 深度 学 习 技术 结合 的 同时 , 解决 了 模型 空间 复杂 度 高 、 复 森 非 线 性 关系 建 模 等 
问题 ,在 Lorenz-96 模拟 数据 上 对 三 种 典型 格 兰 杰 因果 关系 存在 形式 进行 的 实验 ， 
证 明了 本 文 方法 的 有 效 性 和 准确 率 ; 在 真实 人 体 睡 虐 期 间 生 理 系统 的 多 元 时 间 序 
列 上 的 实验 结果 也 印证 了 生理 学 家 的 研究 , 通过 分 析 一 位 受 试 者 整 晚 睡眠 分 期 的 
格 兰 杰 因果 关系 ， 探 索 了 整 晚 睡 眠 中 人 体 各 生理 系统 间 的 动态 格 兰 杰 因果 关系 ， 
具有 潜在 医学 价值 。 
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未 来 的 研究 工作 将 本 文 方法 拓展 应 用 至 时 间 序 列 聚 类 eI、 时 间 序 列 异常 检 
测 B7I 等 下 游 任务 中 ， 在 探索 本 文 方法 的 具体 应 用 场景 的 同时 进一步 完善 本 文 方 
法 。 
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